iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 8
0
自我挑戰組

機器學習入門系列 第 8

ML_Day8(Linear Models for Binary Classification)

  • 分享至 

  • xImage
  •  

簡單回顧
在前面章節有做linear classification、linear regression、logistic regression的介紹,共同點為利用加權的方式計算出分數。從下面的圖可以得知,linear classification在計算error是 NP hard 問題(無法用polynominal解決),在電腦科學領域已經被證明,很難用程式來解決這個問題。
https://ithelp.ithome.com.tw/upload/images/20190920/20116157hY0q3U6XPN.png
https://ithelp.ithome.com.tw/upload/images/20190920/20116157wXVkWg4s09.png

Error Function
假設現在我們的資料是要做binary classification的資料,也就是label y不是+1就是-1,我們把三種models統整一下,整理成 ys 的形式,方便後續做比較。
https://ithelp.ithome.com.tw/upload/images/20190920/20116157iyqu2s602q.png

接下來,我們把上面三種方法畫圖做比較,以 ys 為橫坐標,error 為縱坐標,把這三個函數畫出來(以下是看圖說故事)。

  • 0/1 error: ys ≤ 0時,error = 1,ys > 0時,error = 0,可以很清楚看到,它呈現一個階梯形。
  • square error: ys << 0及ys >> 1時,error都非常大,當只有在ys接近1時,它的error跟0/1的其實是差不多。
  • cross-entropy error: 它是一條平滑的曲線,當ys越大時,error反而越小,ys >> 1時,error趨近於0。

https://ithelp.ithome.com.tw/upload/images/20190920/20116157mtthqZLt1s.png

三種方法做分類的優缺點

  • PLA(0/1): 只有在資料是線性可分時,error才能降到最低,才有辦法得到最佳解。
  • Linear Regression: error function可以很快的求解,但是當ys太大或太小時,都會造成error很大。
  • Logistic Regression: ys太小時,會造成error太大。

整體來說,logistic regression比較好,在資料通常不是線性可風的情況下時,比較常使用 Logistic Regression。
https://ithelp.ithome.com.tw/upload/images/20190920/20116157Bde6VzMSgj.png


上一篇
ML_Day7(Logistic Regression Error)
下一篇
ML_Day9(為什麼會有error)
系列文
機器學習入門28
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言